AI资讯新闻榜单内容搜索-Claude 3.5

Llama 3.1横空出世！开源巨无霸首次击溃闭源，全民GPT-4时代来临

大模型格局，再次一夜变天。Llama 3.1 405B重磅登场，在多项测试中一举超越GPT-4o和Claude 3.5 Sonnet。史上首次，开源模型击败当今最强闭源模型。小扎大胆豪言：开源AI必将胜出，就如Linux最终取得了胜利。

来自主题: AI技术研报

10433 点击 2024-07-24 21:04

VLM集体「失明」？视力测试惨败，GPT-4o、Claude 3.5全都不及格

视觉大语言模型在最基础的视觉任务上集体「翻车」，即便是简单的图形识别都能难倒一片，或许这些最先进的VLM还没有发展出真正的视觉能力？

来自主题: AI技术研报

10289 点击 2024-07-16 19:43

Claude 3.5核心编码prompt揭秘，全网码农沸腾！四步调教法，最新V2版放出

最核心的Claude 3.5编码系统提示，火遍Reddit社区。就在刚刚，原作者发布了进化后的第二版，有的网友已经将其加入工作流。

来自主题: AI技术研报

10572 点击 2024-07-16 19:36

Claude编程支持一键共享，第一批网友已经开始晒作品了

Claude 3.5上新的“工坊模式”（Artifacts）再次更新，写完的网页应用支持一键分享了！

来自主题: AI资讯

6892 点击 2024-07-10 18:48

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Claude 3.5回答离谱，LeCun嘲讽LLM

LLM能否解决「狼-山羊-卷心菜」经典过河难题？最近，菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程，模型在最简单的题目上竟然做错了，甚至网友们发现，就连Claude 3.5也无法幸免。

来自主题: AI资讯

10288 点击 2024-07-01 12:21

Bengio团队提出多模态新基准，直指Claude 3.5和GPT-4o弱点

想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点，大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等技术正是由此产生的灵感。

来自主题: AI技术研报

9415 点击 2024-06-29 00:14

陈丹琦团队图表解读新基准：新王Claude3.5刚及格，但已是模型最强推理表现

Claude 3.5 Sonnet的图表推理能力，比GPT-4o高出了27.8%。针对多模态大模型在图表任务上的表现，陈丹琦团队提出了新的测试基准。新Benchmark比以往更有区分度，也让一众传统测试中的高分模型暴露出了真实能力。

来自主题: AI技术研报

11021 点击 2024-06-29 00:07

Glif 的作者五分钟做了个 AI 梗图生成器，结果风靡推特。

推特上有这么一个作者，今天早上只用了五分钟，使用了 Claude 3.5、ComfyUI、JSON 提取器等模块，搭建了个生成 meme 梗图的生成器，截止目前已经 157.3w 人看过。

来自主题: AI资讯

8094 点击 2024-06-27 17:37

GPT-5一年半后拥有「博士级智能」，Claude 3.5首超人类博士！全知全能ASI将成人类「新神」？

OpenAI CTO Murati表示，GPT-5将在一年半后发布，在某些领域将达到博士的智能；而Claude 3.5 Sonnet，已经成为了第一个测试分数高于最聪明的人类博士的模型。当AGI进一步发展为ASI，它会因为接近神性的全知、全能、无所不在，而被人类敬奉为「新神」吗？当ASI给出一张「希特勒名单」，人类又将怎样？

来自主题: AI资讯

9997 点击 2024-06-22 22:14

GPT-4o一夜被赶超，Anthropic推出Claude 3.5，网友3分钟克隆马里奥游戏

OpenAI劲敌出手，追击GPT-4o。

来自主题: AI资讯

7507 点击 2024-06-22 12:06